Análisis de los fenómenos lingísticos de los mensajes de correo electrónico en catalán desde la perspectiva de la traducción automática

نویسندگان

  • Joaquim Moré
  • Salvador Climent
  • Antoni Oliver
  • Mariona Taulé
چکیده

Emails contain linguistic phenomena that deviate from standard language norms and may cause machine translation errors. In order to design an email translation environment for the Interlingua project developed at UOC, we classified deviations from the standard in a corpus of emails in Catalan and analysed their impact on the machine translation quality in Spanish. Here we present this analysis. Curiously, most translation errors are caused by the lack of linguistic competence of the sender. The impact of characteristic email phenomena (smileys, performance errors, sms vocabulary, etc.) is not so strong.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Construcción de los WordNets 3.0 para castellano y catalán mediante traducción automática de corpus anotados semánticamente

Este art́ıculo describe una metodoloǵıa de construcción de WordNets que se basa en la traducción automática de un corpus en inglés desambiguado por sentidos. El corpus que utilizamos está formado por las propias glosas de WN 3.0 etiquetadas semánticamente y por el corpus Semcor. Los resultados de precisión son comparables a los obtenidos mediante métodos basados en diccionarios bilingües para la...

متن کامل

Desarrollo de una Arquitectura Distribuida Orientada a Objeto para la Monitorización Automática de Vehículos

Este artículo presenta la experiencia en el desarrollo de software orientado a objeto basado en componentes sobre CORBA en una aplicación para la Monitorización Automática de Vehículos (AVM en inglés). El sistema está arquitecturado en base a componentes de radio (para establecer las comunicaciones con los vehículos) y localización (lleva control en tiempo real de la información enviada por los...

متن کامل

DIALNET (Difusión de Alertas en la Red)

Dialnet es un portal de revistas científicas españolas , desarrollado por la Universidad de la Rioja, que ofrece un conjunto de servicios bibliográficos y documentales orientados tanto a bibliotecas que dispongan de colecciones de publicaciones periódicas de esta naturaleza como a investigadores y usuarios finales. Dialnet está accesible en la siguiente dirección web: http://dialnet.unirioja.es...

متن کامل

Una estrategia de integración de Modelos de Objetivos con Análisis Comunicacional

El Análisis Comunicacional (CA del inglés Comunicational Analysis) es un método basado en la comunicación para el modelado de proceso de negocio y requisitos que propone el análisis de los sistemas de información desde una perspectiva comunicacional. Este método se basa en analizar los flujos de información. En un contexto de desarrollo To-Be, donde no se cuenta con documentación previa para an...

متن کامل

Extracción automática de contextos definitorios en textos especializados

Uno de los problemas recurrentes de cualquier área de conocimiento es la organización y explicación de los términos que incluye en su campo de estudio. El reciente avance en el desarrollo de nuevas tecnologías para el trabajo terminológico ha aportado diversas herramientas para tratar de resolver este problema. Una de estas herramientas son los corpus de textos especializados en los cuales se p...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 35  شماره 

صفحات  -

تاریخ انتشار 2005